深度解读 AI 视频推理,Video-LMM:大模型看懂视频的关键技术
过去,我们觉得 AI 能识别一张图片里的猫就算“智能”了。现在,我们希望它看完一段悬疑案件相关的视频,不仅要说出里面发生了什么,还要能分析人物关系,预测下一步剧情,甚至找出破案的关键线索。
过去,我们觉得 AI 能识别一张图片里的猫就算“智能”了。现在,我们希望它看完一段悬疑案件相关的视频,不仅要说出里面发生了什么,还要能分析人物关系,预测下一步剧情,甚至找出破案的关键线索。
10月14日凌晨,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基座的自然语言推理能力,
语音转文字技术已经成为我们日常生活的一部分,从手机语音输入到智能助手,这些系统都依赖一种叫做"交叉注意力"的核心机制。这项由意大利布鲁诺·凯斯勒基金会(FBK)研究院的Sara Papi、Dennis Fucci、Marco Gaido、Matteo Negr
源启数据建模平台是源启·数据资产平台面向企业模型统一管控而打造的多功能、全场景企业级模型设计与管理平台,支持企业级业务数据模型、应用系统模型及数据仓库模型的设计与管理。平台基于Web模式的画布界面,可实现逻辑模型和物理模型设计,具备丰富的正向和逆向建模设计能力
知名技术播客《Dwarkesh Podcast》在9月26日发布了一期视频,《大模型是死胡同》(LLMs are a dead end)。采访嘉宾是2024年图灵奖得主、强化学习之父理查德·萨顿(Richard Sutton)。
文章介绍了美图公司通过内部组织变革和对 AI 工具的深度应用,推动了 AI 应用 RoboNeo 的快速成功。吴欣鸿强调了‘AI 原生组织’的重要性,并呼吁全员拥抱 AI 工具,实现‘人人都是多面手’的目标。
在当今这个科技飞速发展的时代,AI 领域无疑是最受瞩目的焦点。就在今年年初,一款名为 DeepSeek R1 的开源推理模型宛如一颗重磅炸弹,在 AI 圈激起千层浪,瞬间成为了全球 AI 爱好者和从业者热议的话题。
训练 模型 deepseek deepseekr1 r1 2025-10-14 01:52 11
之前一直讲解如何通过各种不同的知识库进行知识片段的检索,并通过提示词临时注入到大模型。从今天开始,我会写一写微调相关的文章。
这项由香港中文大学深圳校区的冯银教授领导的研究团队发表于2025年神经信息处理系统会议(NeurIPS 2025),论文编号为arXiv:2509.17998v2,展示了一种革命性的方法:让大语言模型充当"智能厨师",为贝叶斯优化这道复杂的数学"料理"自动设计
这项由斯图加特大学ELLIS研究所的Alexander Panfilov和Jonas Geiping领导的研究团队发表于2025年1月的《神经信息处理系统》会议,论文编号为arXiv:2509.18058v2。研究团队还包括来自弗劳恩霍夫研究所、苏黎世联邦理工
2025 年 9 月,SCALE 评测基准持续聚焦 AI 在 SQL 领域的应用前沿。本月,榜单新增了 Moonshot AI(月之暗面) 发布的最新模型 ------Kimi-K2-Instruct-0905,还在平台功能上进行了升级,旨在为开发者、研究者和
这项由首尔大学的田亨成(Hyesung Jeon)、李锡俊(Seojune Lee)、姜凡石(Beomseok Kang)、金载俊(Jae-Joon Kim)等学者,以及成均馆大学的金率化(Yulhwa Kim)共同完成的研究,发表于2025年9月的arXiv
最近,明略科技正在冲刺港股IPO,这家被认为“中国最大的营销数据平台”的公司,在招股书里,要建设“企业级AI Agent生态”成了亮点。如果明略能顺利上市的话,将成为2025年具有大模型能力的公司在港IPO的第一股。吴明辉是明略科技创始人、董事长兼CEO,他是
在AI应用的热潮中,“企业知识库问答”“智能客服”“内部文档检索”等落地场景几乎都指向同一种技术路径:RAG(Retrieval-Augmented Generation,检索增强生成,它通过引入外部知识库(如文档库、数据库等),增强生成模型的回答准确性与相关
近年来,银元收藏市场持续升温,部分稀有品种拍卖价格十年间翻涨百倍的消息不胫而走。面对如此惊人的涨幅,许多旁观者不禁疑问:这究竟是市场泡沫,还是藏品价值的理性回归?要回答这个问题,我们需要从历史渊源、价值逻辑和市场数据多个维度进行剖析。
推理能力成为AI领域竞争的核心焦点,推理能力的扩展性被看重,不同团队的模型在这一领域各有表现,有的模型展现出潜力,有的实现赶超,同时也出现了新的推理方式,但推理能力的实际提升情况仍存在争议。
《决策的本质》是一本550多页厚,40多万字的书。光看书名,你可能以为它讲的是管理学上的决策制定。再一看副标题,就不是那么回事了。本书的副标题叫“还原古巴导弹危机的真相”。换句话说,它不是凭空教给你几条做决策的技巧,而是借助1962年古巴导弹危机这个活生生的案
随着模型规模迈入百亿、千亿甚至万亿参数级别,如何在有限显存中“塞下”训练任务,对研发和运维团队都是巨大挑战。NVIDIA Megatron-Core作为流行的大模型训练框架,提供了灵活高效的并行化策略;理解这些策略对显存的影响,才能更好地规划训练超参数,在不
在LV-Eval的128,000词元测试集上,以Qwen2.5-3B模型为例,使用普通滑动窗口注意力(配合注意力锚点技术)的基线方法得分为4.59分。而配备了人工海马网络后,得分提升到5.88分(使用AHN-GDN变体)。更令人惊讶的是,这个得分甚至超过了使用
近日,中央网信办和国家发展改革委联合出台了《政务领域人工智能大模型部署应用指引》(以下简称《指引》)。作为我国首个公开面向政务领域大模型应用的专项政策文件,《指引》围绕应用场景、规范部署、运行管理等方面提出了一系列具有针对性和前瞻性的举措,以政策创新引领推动人